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摘 要 : [目的 /意义 ] 提出 并 优化 科学 数据 的 控制 策略 及 其 模型 ， 有 助 于 推进 科学 数据 平台 
的 基础 制度 建设 ， 平 衡 科 学 数据 安全 保护 与 共享 利用 。 [方法 /过 程 ] 选择 国家 级 科学 数据 
平台 的 用 户 协议 等 为 样本 ， 运 用 扎根 理论 方法 获取 76 个 初始 概念 、9 个 副 范畴 和 5 个 主 范 
畴 ， 进 而 提炼 科学 数据 的 控制 策略 模型 。 [结果 /结论 ] 我 国 科学 数据 平台 已 形成 以 目的 、 
行为 、 权 利 、 身 份 和 责任 为 构成 要 素 的 “五 控 一 体 ”控制 策略 模型 ,建议 从 事前 防御 、 事 中 
管理 和 事后 归 责 方面 ， 优 化 形成 “三 阶段 ”控制 策略 模型 。 具 体 措施 包括 : OTEK BAY 
类 型 ， 强 化 目的 控制 ， 包 明 确 数据 权利 归属 ， 加 强权 利 控制 ; @@ 统 一 分 级 分 类 管理 ， 补 强身 


> 份 控制 ， 外 平衡 平台 管理 与 用 户 控制 ， 转 型 平台 自治 ， 促 进 平台 意识 与 规范 统一 ， 新 增 行业 
2 他 律 ，@ 合 理 分 配 平台 、 用 户 和 科学 数据 提供 者 的 责任 。 

em 关键 词 ， 科学 数据 ” ”控制 策略 ”扎根 理论 。 行为 控制 权利 控制 
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1 引言 
2022 年 ,《 中 共 中 央 国务 院 关 于 构建 数据 基础 制度 更 好 发 挥 数据 要 素 作用 的 意见 》( 以 
下 简称 《数据 二 十 条 》) 指出 数据 基础 制度 建设 事 关 国家 发 展 和 安全 大 局 山 。2023 年 ， 国 家 


C 数据 局 的 组 建 意味 着 我 国 数据 基础 制度 建设 进入 新 阶段 。 科 学 数据 是 国家 战略 性 资源 之 一 ， 
点 与 科学 数据 平台 (或 中 心 ) 相关 的 基础 制度 建设 同样 应 备 受 重视 。 早 在 2018 年 ，《 科 学 数 
o, 


据 管理 办 法 》《〈 以 下 简称 《办 法 》) 就 对 科学 数据 进行 了 界定 。《 办 法 》 规 定 科学 数据 应 以 
开放 为 常态 、 不 开放 为 例外 为 原则 叫 ， 确 立 了 我 国 科学 数据 平台 建设 应 当 以 开放 、 共 享 为 价 
值 导 向 。 在 此 背景 下 ， 科 学 数据 平台 不 仅 需要 合理 地 管理 已 有 科学 数据 ， 筑 牢 科 学 数据 安全 
屏障 ， 还 应 当 安 全 有 序 地 开展 科学 数据 共享 ， 一 套 合理 有 效 的 科学 数据 控制 策略 至 关 重 要 。 
形成 切实 可 行 、 系 统 科 学 的 控制 体系 ， 方 能 建设 优质 的 科学 数据 平台 ,满足 国内 优势 产业 的 
发 展 需 求 ， 起 到 支撑 国家 科技 创新 、 经 济 社会 发 展 和 国家 安全 的 作用 。 

截至 2023 年 3 H, BET UI AHL, 国内 外 关于 科学 数据 的 研究 成 果 非 常 丰富 。 例 如 ， 
国内 成 果 就 涉及 科学 数据 的 元 数据 、 利 益 相关 者 、 质 量 、 素 养 、 管 理 、 平 台 〈 中 心 ) S. 


ee eee 基金 青年 项 目 “数据 要 素 确 权 的 法 律 供 给 研究 ”《 项 目 编号 : 21CFX007) 研究 成 果 
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开放 共享 、 安 全 人 保障、 服务、 引用、 关联、 融合、 使用、 出版、 监管 、 隐 私 保护 以 及 与 个 人 
数据 保护 协同 等 方面 ， 各 方面 还 可 以 继续 细 分 主题 。 为 了 精简 篇 幅 和 集中 主题 ， 在 确定 现 有 
成 果 未 涉及 “科学 数据 的 控制 策略 ”之 后 ， 考 虑 到 本 文 的 样本 来 源 于 科学 数据 平台 〈 中 心 ) ， 
故 将 文献 综述 内 容 聚 焦 到 科学 数据 平台 〈 中 心 ) 。 

在 中 国 知 网 学 术 期 刊 《CSSCI) ， 以 “科学 数据 平台 ”“ 科 学 数据 中 心 ”“ 科 学 数据 共 
享 平台 ”和 “科学 数据 共享 中 心 ”为 检索 词 进行 篇 名 精确 检索 。 我 国 目前 以 科学 数据 (共享 ) 
平台 /中 心 作为 研究 对 象 的 研究 成 果 相 对 较 少 ， 主 要 涉及 : OBA, lun “A+” XR 
境 有 助 于 形成 科学 数据 共享 的 深度 融合 、 人 人 参与 的 优势 环境 , 为 完善 科学 数据 共享 平台 的 
构建 和 保障 科学 数据 资源 的 高 效 利 用 提供 了 有 利 条 件 B]， 国 内 现 有 平台 在 组 织 管理 、 资 源 建 
设 、 用 户 服务 多 方面 探索 力求 形成 相对 完整 的 基础 建设 内 ， 但 仍 存在 服务 方式 单一 、 强 化 数 
据 主导 而 忽视 数据 服务 名 、 规 范 性 说 明 不 足 、 内 容 整 合 层次 较 浅 、 资 源 获 取 不 够 直接 中 等 问 
题 。@ 专 业 性 平台 ,涉及 国家 农业 科学 数据 共享 中 心路、 中 国 西部 环境 与 生态 科学 数据 中 心 
I、 开放 医 学 科学 数据 平台 中、 黄河 流域 专题 数据 的 国家 科学 数据 中 心中 、 长 三 角 跨 区 域 科 
学 数据 中 心 凯 、 野 外 科学 观测 研究 台 站 网络 ) 和 科学 数据 中 心 归 、 复 旦 大 学 社会 科学 数 
据 平台 031， 以 及 湖南 省 科技 信息 与 科学 数据 共享 平台 0 等 多 领域 的 科学 数据 中 心 。 加 具体 
建设 内 容 ， 主 要 分 布 在 科学 数据 共享 平台 的 绩效 评估 05 与 服务 效能 分 析 09、 引 用 规范 调查 
研究 1、 被 引用 状况 调查 分 析 08、 数 据 管理 研究 09J、 用 户 注 册 协 议 合 规 性 29 等 方面 ， 也 有 
学 者 聚焦 于 开源 技术 20、 知 识 管理 P2 等 应 用 技术 方面 。 外 国外 数据 库 研 究 启示 ， 有 学 者 调 
查 了 德国 地 球 科 学 领域 科学 数据 中 心 ， 提 出 符合 我 国 相关 领域 数据 中 心 的 发 展 概念 图 P3]; 
还 有 学 者 研究 欧美 生物 医学 科学 数据 中 心 后 ,从 基础 保障 、 基 础 设施 、 资 源 建 设 、 技 术 研 发 、 
标准 规范 、 用 户 服务 6 个 方面 提出 启示 鸣 。 

在 Semantic scholar 检索 2014 年 以 来 的 英文 文献 , 以 “ scientific data platform” “scientific 
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data center scientific sharing data platform” 7I “scientific sharing data center” WE{T fa 44 12 
索 ， 并 以 Google scholar, Web of science 为 辅助 的 数据 来 源 进行 补充 检索 ， 人 工 筛选 前 述 时 
间 范 围 内 的 文献 。 近 10 年 来 ， 国 外 相关 针对 科学 数据 (共享 ) 平台 (中 心 ) 的 研究 主要 涉 
及 : Q 吧 实践 状况 ,例如 开放 科学 数据 中 心 的 实践 现状 RI、 科 学 数据 中 心 的 数据 管理 原则 B29; 
@ 专 业 性 平台 ， 例 如 开放 的 电子 科学 数据 共享 平台 (B2SHARE) R71、 虚拟 分 子 科学 数据 
ù CVHERLAO Bl 等 ，@@ 具 体 建设 内 容 ， 例 如 科学 数据 的 应 用 系统 外、 是 否 云 端 化 3、 目 
录 管 理 B1 等 。 

综 上 所 述 , 国内 外 研究 都 侧重 于 科学 数据 平台 建设 ,在 实践 状况 、 专 业 平 台 建 设 与 具体 
建设 内 容 方面 形成 了 一 定 的 成 果 , 国内 还 注重 国外 数据 库 研究 启示 , 对 科学 数据 控制 策略 关 
注 不 够 。 鉴 于 此 ， 本 文选 择 国家 级 科学 数据 中 心 为 研究 对 象 , 分 析 平 台 实践 中 的 科学 数据 控 
制 策略 ， 提 炼 模型 并 提出 相应 优化 建议 ， 以 期 引发 学 界 对 “控制 策略 ”主题 的 关注 ， 进 而 推 
动 形 成 科学 数据 控制 策略 理论 。 


2 研究 过 程 
2.1 筛选 样本 

基于 国家 科技 基础 条 件 平台 中 心 , 获取 20 个 国家 科学 数据 中 心 和 31 个 国家 资源 库 名 录 
(以 下 简称 “国家 级 科学 数据 平台 ”) 。 在 各 平台 官网 检索 用 户 注册 协议 、 科 学 数据 共享 政 
策 或 用 户 使 用 说 明 等 可 能 涉及 科学 数据 管理 内 容 的 相关 文件 (以 下 统称 “用 户 协 议 ”) ， 但 
大 部 分 平台 并 没有 相关 文件 , 用 户 通过 注册 可 直接 登录 网 站 获取 数据 ， 有 9 个 平台 无 需 注册 
即 可 下 载 数 据 ， 最 后 获取 11 个 国家 科学 数据 中 心 和 3 个 国家 资源 库 的 用 户 协议 。 通 过 人 工 
阅读 协议 全 文 ， 共 提取 51 个 涉及 科学 数据 的 原始 语 段 〈 见 表 1) 。 需 要 注意 的 是 ， 由 于 多 
数 平台 笼统 地 将 服务 条 款 、 免 责 声明 、 共 享 政策 等 置 于 一 个 文件 中 , 不 同 平台 的 文件 不 一 致 ， 
原始 语 段 在 各 样本 中 的 位 置 也 不 一 样 ， 既 可 能 在 隐私 政策 部 分 ， 也 可 能 在 免责 声明 等 部 分 。 

表 1 涉及 科学 数据 内 容 的 国家 级 科学 数据 平台 样本 


Table 1 Samples of national scientific data platform including scientific data content 


和 人 :五 
ae 平台 名 称 原始 语 段 所 在 位 置 网 址 。 
1S E AE RES US noto 数据 使 用 说 明 https://nmdc.cn/ 1 
28 国家 基因 组 科学 数据 中 心 隐私 政策 ， 免 责 声明 https://ngdc.cncb.ac.cn/ 1 
3S 国家 青藏 高 原 科 学 数据 中 心 隐私 政策 ， 使 用 条 款 ; 免责 声明 | https://data.tpde.ac.cn/ 5 
4S 国家 计量 科学 数据 中 心 用 户 注册 协议 https://www.nmdc.ac.cn/ 4 
5S 国家 地 球 系 统 科 学 数据 中 心 用 户 服务 协议 http://www.geodata.cn/ 3 
6S 司 家 人 口 健康 科学 数据 中 心 Fei A Se Bs 免责 声明 ; 用 户 https://www.nemi.cn/phda/support.html?type 4 
注册 须知 =md028 
7S 国家 基础 学 科 科 学 数据 中 心 ”| 用 户 服务 协议 ;免责 声明 https://nbsdc.cn/ 
99 国家 林业 和 草原 科学 数据 中 心 http://www.forestdata.cn/ 
9S 国家 气象 科学 数据 中 心 服务 条 款 ; 用 户 权益 http://data.cma.cn/ 4 
10S 国家 地 震 科学 数据 中 心 用 户 注册 协议 https://data.earthquake.cn/index.html 2 
LIS 国家 海洋 科学 数据 中 心 用 户 许可 协议 http://mds.nmdis.org.cn/ 3 
128 国家 海洋 水 产 种 质 资源 库 共享 服务 管理 办 法 http://marine.fishinfo.cn/ 14 
135 国家 重要 野生 植物 种 质 资 源 库 | 隐私 政策 、 服 务 条 款 https://seed.iflora.cn/ 2 
14S | 国家 植物 标本 资源 库 (NPSRC) | 注册 用 户 使 用 协议 https://www.cvh.ac.cn/ 1 


2.2 选择 方法 

在 质 性 研究 领域 ， 格 拉 斯 CB. Glaser) 和 斯 特 劳 斯 CA. Strauss) 提出 的 “扎根 理论 ” 
(grounded theory) 被 广泛 运用 。 国 内 学 者 考究 认为 ， 扎 根 理论 的 主要 宗旨 是 从 经 验资 料 的 
基础 上 建立 理论 一 一 研究 者 在 研究 开始 之 前 一 般 没有 理论 假设 , 直接 从 实际 观察 入 手 , 从 原 
始 资料 中 归纳 出 经 验 概括 , 然后 上 升 到 理论 B24。 不 同 于 运用 扎根 理论 方法 辑 止 于 构建 理论 B3l 
或 模型 Bq、 归 纳 因素 B3 等 ， 即 编码 后 就 落脚 到 理论 、 模 型 或 因素 之 上 ， 本 文 的 研究 目标 有 
Wi: @ 尽 可 能 客观 地 呈现 科学 数据 控制 策略 的 实 然 现状 ， 即 “ 实 然 模型 ”是 什么 样 的 ; © 
在 此 基础 上 提出 科学 数据 控制 策略 的 优化 方案 ， 即 “应 然 模型 ” 是 怎么 样 的 。 为 了 实现 这 两 
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个 目标 ， 主 要 运用 扎根 理论 方法 ， 加 


有 之 以 词 频 统计 方法 。 
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旺 现实 然 现状 的 传统 做 法 是 依靠 假设 、 经验 和 归纳 ,基本 上 是 从 素材 直接 到 结果 ,往往 


会 因为 研究 者 的 认识 、 


理解 和 价值 取向 等 因素 ,导致 结果 存在 较 大 误差 。 扎 根 理论 方法 一 开 


编码 后 进行 饱和 度 检 验 ， 


始 就 不 做 任何 预 设 , 从 初始 概念 就 “忠实 ”于 原始 素材 ,是 


下 逐步 完成 范畴 、 副 范畴 或 主 范畴 ， 


论 在 发 展 过 程 中 形成 了 经 典 扎 根 理论 


能 尽 可 能 确保 结果 的 客观 性 和 全 面 性 。 此 外 ， 从 收集 整理 的 样本 来 
看 ,科学 数据 的 相关 内 容 分 布 在 不 同 平台 的 用 户 协 议 , 涉及 用 户 注册 、 科 学 数据 共享 或 使 用 
说 明 等 相关 内 容 ， 而 扎根 理论 方法 适合 规模 大 、 碎 片 化 样本 的 定量 和 定性 分 析 B9。 扎 根 理 


(开放 编码 、 选 择 编 


码 、 理 论 编码 ) 、 


程序 化 扎根 理论 


(开放 编码 、 主 轴 编 码 、 选 择 编码 ) 和 构建 主义 扎根 理论 (初级 编码 、 聚 焦 编码 、 轴 心 编码 


和 理论 编码 ) 3 种 不 同 范 式 ， 当 前 程序 化 扎根 理论 方法 仍 是 我 国 图 情 研 究 应 用 的 主流 B24。 考 
虑 到 归纳 科学 数据 控制 策略 的 内 容 需 要 开放 编码 、 主 轴 编 码 、 选 择 编码 ， 故 具体 选择 程序 化 


扎根 理论 方法 。 


诚然 , 运用 扎根 理论 方法 与 量化 实证 研究 不 同 , 研究 者 在 进入 田野 调查 之 前 并 不 提出 理 


范畴 、 


LL 


veli, e ELBOW Oe BE PET A, Inf ET 
学 数据 管理 策略 理论 模型 ， 不 需要 统计 概念 、 
进行 词 频 统计 ， 是 试图 揭示 科学 数据 控制 策略 的 “ 实 然 模型 ”的 各 构成 要 素 的 比重 ， 由 此 量 


论 B39。 如 果 只 是 为 了 提炼 科 


主 范 畴 的 频次 。 本 文 之 所 以 在 此 基础 上 


化 要 素 在 实践 中 被 重视 的 程度 。 因 本 文 是 基于 全 样本 展开 分 析 , 这 些 样本 反映 的 是 科学 数据 


空 制 策 略 的 整体 现状 ， 所 以 基于 概念 、 


范畴 、 主 范畴 的 频次 和 占 比 能 够 客观 反映 其 所 指 代 对 


象 在 整体 现状 中 的 重要 性 。 由 于 各 样本 来 自 不 同 国 家 级 科学 数据 平台 , 每 个 平台 对 于 科学 数 
据 的 规定 ， 既 有 共性 之 处 ， 又 有 个 性 之 处 ， 统 计 频 次 并 计算 占 比 具有 一 定 意义 。 在 总 体 样 本 
数量 一 定时 ， 占 比 能 够 说 明 一 些 问 题 一 一 占 比 小 不 一 定 是 个 性 之 处 , 但 占 比 大 在 较 大 程度 上 


说 明 具 有 共性 之 处 。 虽 然 不 能 仅 依靠 占 比 来 说 明 其 重要 必 
通用 做 法 。 例 如 ， 行 为 控制 出 现 71 次 、 占 比 69.61%， 说明 行 为 控制 是 科学 数据 控制 策略 的 


通用 实践 ; 目的 控制 出 现 7 次、 占 比 


E, 但 是 占 比 确实 能 够 反映 实践 中 的 


6.86%， 说 明 目 的 控制 在 科学 数据 控制 策略 中 较 少 被 运 


鉴于 此 ,运用 词 频 统 计 方法 有 助 于 明确 科学 数据 控制 策略 的 内 部 要 素 及 其 组 合 的 优化 思 
路 。(D 如 果 某 要 素 在 “ 实 然 模 型 ”中 比重 高 : 根据 专家 经 验 认 为 其 对 于 科学 数据 控制 策略 重 
要 ， 则 应 建议 维持 或 提升 ; 根据 专家 经 验 认 为 其 对 于 科学 数据 控制 策略 不 重要 ， 则 应 建议 降 
低 。 包 如 果 某 要 素 在 “ 实 然 模型 ”中 比重 低 : 根据 专家 经 验 认为 其 对 于 科学 数据 控制 策略 很 
重要 ， 则 应 建议 适当 提升 ; 根据 专家 经 验 认 为 其 对 了 


E 持 或 降低 。 总 的 来 说 ， 本 文 试图 在 运用 扎根 天 


Nt 


为 辅助 方法 完成 定量 分 析 ， 尽 可 能 使 


结论 可 靠 、 建 议 合理 。 


H 


六 科学 数据 控制 策略 可 有 可 无 ， 则 应 建议 
论 方法 进行 质 性 分 析 的 基础 上 ， 引 入 词 频 作 


2.3 处 理 样 本 
2. 3. 1 开放 性 编码 
开放 性 编码 是 从 原始 语 段 中 提取 重点 语句 ,形成 初始 概念 的 过 程 , 提取 重点 语句 有 助 于 
使 初始 概念 更 加 “忠实 ”于 原始 素材 。 编 码 过 程 中 ， 一 个 原始 语 段 往往 蕴含 多 个 重点 语句 ， 
原始 语 段 与 初始 概念 基本 上 是 一 对 多 ， 很 少 是 一 对 一 。 鉴 于 篇 幅 ， 考 虑 到 样本 38 涵盖 “一 
对 一 ”“ 一 对 多 ”情形 且 篇 幅 适 中 ， 故 以 其 作为 开放 性 编码 示例 〈 见 表 2) 。 为 了 呈现 提炼 
的 思维 过 程 ， 在 表 2 中 呈现 了 重点 语句 提取 步骤 。 

表 2 科学 数据 原始 语 段 的 开放 性 编码 〈 示 例 ) 


Table 2 Open coding of scientific data primitives (examples) 


H 


FARE 原始 语 段 内 容 原始 语 段 编写 重点 语句 提 取 WAS 
“国家 青藏 高 原 科 学 数据 中 心 ”网 站 上 的 一 切 数据 和 和 | 网 二 中 一 切 数据 和 资料 版 权 只 
资料 版 权 归 数 据 和 资料 原生 产 单位 所 有 3801001 — | 原生 产 单位 所 有 版 权 归 原生 7 单位 
为 保障 数据 开发 者 的 著作 权 ， 用 户 在 使 用 全 部 或 部 分 ee 
“国家 青藏 高 原 科学 数据 中 心 ” 所 产 出 的 研究 成 果 中 | 。 3S02001 | A CHIP | 使 用 须 标明 出 处 
须 在 相关 成 果 的 显著 位 置 上 明确 注 明 数 据 来 源 R 
不 得 将 数据 转让 给 第 三 方 ， 由 此 引起 的 一 切 后 果 由 数 | 3503001 和 将 数据 转让 给 第 三 方 TEE 

cC i 用 户 承担 3S03002 一 切 后 果 由 数据 用 户 承担 户 自 担 风险 

) 从 数据 中 心 获 取 的 数据 如 属于 数据 保密 范围 ， 用 户 须 3S04001 使 用 保密 数据 须 签 署 保 密 协议 | 保密 数据 使 用 要 求 
与 “国家 青藏 高 原 科学 数据 中 心 ”签署 保密 协议 ， 如 如 出 现 问题 ， 用 户 承担 完全 责 | 、 N 
出 现 问题 ， 用 户 承 担 完 全 责任 EM E. IP BAR 
FR HE) 的 任何 材料 都 含有 版 权 提示 信息 ， m ] 户 不 得 删改 相关 版 权 的 提示 | 不 得 删改 版 权 提示 
用 户 不 得 删改 相关 版 权 提示 信息 ， 防 止 该 文件 的 全 部 sg 5B 
或 部 分 被 用 于 其 它 目的 ， 删 改版 权 提 示 信 息 的 用 户 将 j 户 而 减 版 权 提 示 信 息 应 承担 
据 著作 权 法 承担 版 权 侵权 责任 3505002 | 版 权 侵权 责任 承担 版 权 侵 权 责 任 


2. 3.2 主轴 性 编码 

主轴 性 编码 是 在 初始 概念 的 基础 上 提取 副 范 畴 ， 并 合并 同类 副 范 畴 得 到 主 范畴 的 过 程 。 
一 个 初始 概念 可 提取 一 个 副 范 畴 , 但 是 在 汇总 各 初始 概念 和 副 范畴 时 , 前 者 与 后 者 是 多 对 一 
的 数量 关系 。 同 样 ， 副 范畴 和 主 范畴 也 是 多 对 一 的 数量 关系 。 如 表 3 所 示 ， 在 76 个 初始 概 
念 的 基础 上 进行 提炼 , 共 获 取 9 个 副 范 畴 , 即使 用 行为 要 求 、 获 取 行 为 要 求 、 管 理 行为 要 求 、 
使 用 目的 限制 、 风 险 责任 承担 、 获 取 身 份 限制 、 知 识 产 权 归 属 、 数 据 权 利 归 属 和 用 户 权利 限 
制 ; 在 此 基础 上 获取 5 个 主 范畴 ， 即 行为 控制 、 目 的 控制 、 责 任 控制 、 身 份 控制 和 权利 控制 。 
表 3 科学 数据 控制 策略 主轴 性 编码 汇总 


Table 3 Spindle coding of scientific data control strategy 


Fl iy ie 十 3 、 HIJ vts Rz + v5 
初始 概念 (频次 /次 ) is T. 初始 概念 (频次 /次 ) Ey rs 
1-4 级 用 户 可 互相 使用 数据 违反 规范 平 合 将 采 取 措施 
保护 机 密 数据 编号 管理 
保密 数据 使 用 受 限 数据 保护 期 依 用 户 级 别 确 定 
不 得 进行 转 售 或 商业 利用 (3) 使 用 行为 要 求 |  、 设立 专门 机 构 管理 行为 要 求 | ，、,、 
不 得 删改 版 权 提示 信息 (46) 行为 控制 (51) | 安排 专人 负责 (20) 行为 控制 (20) 
不 得 衍生 利用 按 平 侣 规定 录入 数据 并 报 送 
不 得 转 证 〈2) 提交 本 类 数据 的 附加 条 件 
超出 保护 期 限 的 数据 可 免费 中 请 借用 每 月 另存 、 每 年 刻录 存档 


优先 使 用 网 站 提供 的 引用 方式 和 标识 vide di dd 
仅 用 于 已 批准 研究 数据 维护 更 新 需 专门 人 员 
禁止 出 售 (2) 备份 需 专用 措施 、 专 人 定期 
禁止 识别 《2) 拟 更 新 数据 需 专人 审核 
禁止 违规 共享 确认 更 新 的 数据 需 提交 审查 
访问 受 控 数 据 需 获 批 需 专 人 负责 数据 更 新 维护 
使 用 需 包 括 版 权 声 明 本 地 数据 经 审核 可 远程 更 新 
使 用 须 标明 出 处 《6) 通过 审核 的 数据 可 公开 发 布 
中 英 使 用 均 需 注 明 原始 来 源 成 员 单 位 可 独立 提供 数据 服务 
使 用 须 保留 作者 或 授权 人 对 原作 品 的 寺 平台 负责 发 布 数据 、 审 批 申请 、 
名 提供 数据 服务 
使 用 需 获得 权利 人 许可 平台 负责 对 外 发 布 并 说 明 
使 用 需 经 授权 平台 提供 服务 配备 专门 设备 
更 ES 寄 送 成 果 (2) 不 得 / TA As 的 (5) 
受 控 数 据 使 用 规范 需 以 获得 信息 为 目的 使 用 目的 限制 E 
数据 生产 者 自由 使 用 或 处 置 所 生产 的 数 严禁 任何 未 经 本 协议 明确 充 许 (1) 
据 的 目的 使 用 
ZA SEE ween » uy 4 SE Ze 
a 载 或 修改 下 他 知识 产权 归 本 平台 CD 知识 产权 归属 
未 妥 书 面 同意 不 得 发 布 末 平 侣 任何 内 容 版 权 归 原作 者 与 平台 共有 a 
灯 经 事先 书面 同意 不 得 以 任何 方式 侵犯 不 始 数 据 和 数据 信息 的 权限 归 | SORA | 权利 控制 (9) 
知识 产权 原单 位 所 有 (2) (2) 
条 至 书面 许可 不 得 对 外 提供 (3) 用 户 享有 有 限 使 用 权 (2) 人 
KAPET EIE 公开 数据 不 限 身份 均 可 获取 
采 芭 书面 许可 严禁 创建 或 编辑 文集 、 汇 相关 部 门 经 认可 后 可 免费 获取 
T 数据 库 或 人 名 地 址 录 数据 
于 高 面 许可 不 得 修改 、 传 播 及 销售 协议 共享 数据 限 协议 用 户 获 取 
Avr A HB EL 协议 公开 数据 限 协议 用 户 获取 | 获取 身份 限制 | yoy cg) 
来 到 允许 不 得 用 于 外 部 使 用 高 级 用 户 获 取 数 据 限制 (9) = 
需 提交 用 途 与 人 员 信 息 普通 用 户 获取 数据 限 册 
协议 用 户 按 流程 获取 协议 共享 数据 公开 数据 不 限 身份 自由 获取 
保密 数据 申请 批准 后 获取 注册 用 户 权限 
用 襄 可 向 成 员 单 位 申请 获取 逆 据 获取 行为 要 求 (5) 非 实 名 注册 用 户 受 限 
用 记 可 向 平台 申请 获取 数据 用 户 自 担 风 险 (5) 风险 责任 承担 责任 控制 (6) 
保护 期 外 数据 经 申请 获取 承担 版 权 侵权 责任 (6) X 
注 ， 该 表 括 村 中 的 数字 是 表示 频次 ， 若 没有 括 写 和 数字 则 表示 频次 为 1 


2. 3. 3 选择 性 编码 
分 析 副 范畴 之 间 的 关系 可 发 现 ， 获 取 身 份 限制 、 使 用 目的 限制 、 风 险 责任 承担 、 用 户 权 
利 限 制 、 知 识 产权 归属 和 数据 权利 归属 均 对 使 用 行为 要 求 、 获 取 行 为 要 求 或 管理 行为 要 求 产 
生 影 响 ， 实 质 上 仍 是 通过 影响 用 户 或 平台 的 行为 实现 控制 效果 〈 见 表 4) 。 在 此 基础 上 ， 分 
析 主 范畴 之 间 的 关系 〈 见 图 D : 行为 控制 在 科学 数据 平台 实施 科学 数据 控制 策略 时 发 挥 核 
心 作 用 ， 目 的 、 责 任 、 身 份 、 权 利 的 控制 也 会 通过 影响 行为 而 起 到 控制 效果 。 
表 4 科学 数据 控制 策略 选择 性 编码 


Table 4 Selective coding of scientific data control strategy 


N 


pa 


范畴 关系 代表 性 重点 语句 关系 内 涵 解 读 
的 控制 一 行为 控制 | 所 有 的 资料 和 图 象 均 不 得 用 于 商业 目的 通过 限制 用 户 使 用 目的 ,， 禁止 
用 户 的 商用 行为 
责任 控制 -行为 控制 “| 您 对 此 类 数据 的 任何 接收 、 依 赖 或 使 用 均 由 您 自行 承担 风险 。NGDC 不 对 相 | 通过 事前 告知 责任 承担 ,提醒 
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关 信 息 的 错误 、 不 准确 或 遗漏 承担 任何 法 律 责任 用 户 谨慎 使 用 科学 数据 
身份 控制 一 行为 控制 | 协议 用 户 可 直接 下 载 协议 公开 数据 ; 普通 用 户 需 到 个 人 中 心 页 面 完善 个 人 资 | 设置 平台 审核 来 限制 用 户 身 
料 ， 申 请 升级 为 协议 用 户 , 待 管理 员 审 核 通过 , 方 可 下 载 获取 协议 公开 数据 | 份 资 格 ， 限 制 用 户 获 取 数据 
权利 控制 二 行为 控制 | 网 站 中 一 切 数据 和 资料 版 权 归 原 生产 单位 所 有 通过 事先 声明 权利 归属 ,提醒 
用 户 仅 可 有 限 使 用 科学 数据 


1 科学 数据 的 “五 控 一 体 ” 控 制 策略 模型 


Figure 1 Model of the“five-control-in-one” strategy of scientific data 


2.3.4 饱和 度 检 验 


在 运用 程序 化 扎根 理 


Lied 


全 样本 编码 ， 可 以 选择 检验 饱 


部 构成 要 素 〔 以 副 范 畴 、 


此 外 ，; 


局 码 时 : 如 果 是 抽样 编码 ， 则 理论 饱和 度 检验 必 不 可 少 ; 
和 度 B91。 本 文 需 掌握 科学 数据 控制 策略 现状 ， 即 分 析 模 型 内 


| 风险 责任 承担 | 


和 EI 


如 果 是 


E 论 饱和 度 检验 之 用 ， 未 将 
行 编码 ， 其 编码 结果 仍 与 之 前 得 到 的 副 范 畴 、 


的 
其 


与 


畴 为 表征 ) 的 占 比 ， 故 需要 完成 全 样本 编码 ， 在 此 意义 上 可 视 
为 已 达到 饱和 。 但 本 文 仍然 进行 饱和 度 检验 :在 编码 到 第 10 个 样本 时 
不 再 出 现 新 类 型 ， 继 续 完 成 第 11 一 13 个 样本 文件 编码 ， 也 没有 发 现 新 
各 随机 预 留 的 编号 14S 的 样本 作为 到 
码 ， 而 是 在 其 他 样本 编码 全 部 完成 后 再 对 其 进 


下 范畴 和 主 范畴 均 


他 样本 一 起 编 


7 


主 范畴 相符 〈 见 表 5) 。 通 过 前 述 双 重 验证 ， 可 认为 本 文 编 码 达到 了 饱和 。 


表 5 科学 数据 控 


出 策略 编码 的 饱和 度 检验 


Table 5 Coding saturation test of scientific data control strategy 
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3.1.2 用 户 获取 行为 控制 : 通过 申请 程序 实现 


“POUT BOR” OL 


HE 5 次 ， 在 行为 控 于 


可 能 在 于 获取 只 是 使 有 


学 数据 的 实践 中 很 少 被 运用 。 原 因 
于 使 用 ， 多 数 平 台 出 于 节省 成 本 或 避免 


过 多 关注 获取 行为 。 在 现 有 规定 中 ， 平 台 的 科学 数据 控制 
] 户 按 流程 获取 协议 共享 数据 ”是 依据 不 同 


例如 “协议 


， 用户 的 意图 多 


E 复 规定 等 考量 , 侧重 对 使 用 行为 作出 要 求 , 而 没 


思路 体现 在 前 置 申请 


j 户 等 级 而 设置 ， 


“保密 数据 申请 


| 策略 中 占 比 7.04%， 说 明 获取 行为 在 控制 科 
数据 的 步 又 之 一 


在 
有 


程序 设置 上 ， 


批 


编号 平台 名 称 原始 语 段 编码 重点 语句 提取 初始 概念 fall Yu 主 范畴 
户 UE t Pa" F4 xk] UN 5 UN $5 和 
p 可 看 完整 植物 标本 采 | 14501001 ee 注册 用 户 权限 获取 身份 限制 | 身份 控制 
ids 国家 植物 标本 傈 地 ( 非 实 名 注册 用 户 的 植物 标本 采集 地 
资源 库 (NPSRC) 只 能 查看 采集 省 份 ) 14S01002 | 非 实名 注册 用 户 只 能 查 | 非 实 名 注册 用 户 受 限 | 获取 身份 限制 | 身份 控制 
^ ~ 看 植物 标本 的 采集 省 份 
3 研究 结论 
3.1 三 种 行为 策略 涉及 两 类 主体 
行为 控制 是 指 通过 规定 或 限制 主体 行为 实现 控制 的 策略 ， 涉 及 两 类 主体 : OH, 通过 
设置 限定 条 件 来 限制 用 户 的 使 用 行为 或 获取 行为 ， 此 时 的 控制 策略 概括 为 “使 用 行为 要 求 ” 
和 “获取 行为 要 求 ”; @ 平 台 ， 详 列 出 本 平台 管理 科学 数据 的 措施 ， 力 图 实现 对 科学 数据 的 
有 序 管理 ， 其 背后 体现 了 对 已 有 科学 数据 的 正 向 控制 理念 ， 此 时 的 控制 策略 概括 为 “管理 行 
为 要 求 ”。 
3.1.1 用 户 使 用 行为 控制 : 选择 空间 非常 之 小 
“使 用 行为 要 求 ” 出 现 46 次 ， 在 行为 控制 策略 中 占 比 64.79%， 说 明 使 用 行为 要 求 是 控 
制 科 学 数据 的 通用 实践 ， 也 即 控制 策略 中 的 重点 所 在 。 对 “使 用 行为 要 求 ” 进 行 二 次 分 类 发 
现 ， 使 用 行为 要 求 可 分 禁 为 、 应 为 和 可 为 3 种 ， 其 中 : 定 频次 为 24 次 ， 在 使 用 行为 
要 求 中 占 比 超过 半数 ;应 为 规定 频次 为 18 次 ;可 为 规定 频次 最 少 〈 见 表 6) 。 这 说 明 在 使 
用 行为 要 求 方面 ， 平 台 为 用 户 划 分 了 较为 清晰 的 边界 ， 带 有 强制 意味 的 “ 禁 为 ”和 “应 为 ” 
占 比 91.30%， 说 明 用 户 “ 可 为 ”的 选择 空间 非常 之 小 。 
表 6 “使 用 行为 要 求 ” 的 二 次 分 类 
Table 6 Secondary classification of “use behavior requirements” 
A "E 性 质 er re Se 性 质 性 质 
初始 概念 (频次 /次 ) (频次 /次 ) 初始 概念 (频次 /次 ) (频次 /次 ) 初始 概念 (频次 /次 ) (频次 /次 ) 
-一 | 不 得 转让 (2 使 用 需 经 授权 (2) 超出 保护 期 限 的 数据 免 
CO) 不 得 删改 版 权 提示 信息 CD 使 用 需 标明 出 处 (7) 费 申请 即 可 使 用 (1) 
不 得 衍生 利用 A) 使 用 需 包 括 版 权 声 明 (2) 数据 生产 者 自由 使 用 或 
不 得 进行 商业 利用 (3) 禁 为 规定 | 使 用 需 将 成 果 寄 送 存 档 (2) | ”应 为 规定 ”| 处 置 所 生产 的 数据 (1) | ”可 为 规定 
未 经 许可 不 得 换 自 使 用 C8》 (24) 仅 用 于 已 批准 研究 (1) (18) 1 一 4 级 用 户 可 以 互相 (4) 
禁止 违规 共享 (5) 保护 机 密 CD 使 用 数据 (1) 
LV QD 受 控 数据 使 用 规范 (2) 请 优先 使 用 网 站 提供 的 
禁止 出 售 (2) 需 提 交 用 途 与 人 员 信 息 引用 方式 和 标识 CD 


C hinay n pe 
ChinaXiv& 


'EHRTII 
FRHTII 


准 后 获取 ”和 “保护 期 外 数据 经 申请 获取 ”是 依据 不 同 数据 分 级 而 设置 ，“ 用 户 可 向 成 员 单 
位 申请 获取 数据 ”和 “用 户 可 向 平台 申请 获取 数据 ”是 依据 不 同 提供 主体 而 设置 。 虽 然 “ 依 
HE” 各 有 不 同 ， 但 都 是 针对 获取 过 程 中 的 特殊 情况 规定 “ 拟 获取 ， 先 申请 ”， 若 用 户 没有 事 
先 申请 ， 则 无 法 直接 从 平台 处 获取 到 相应 的 科学 数据 。 
3.1.3 平台 管理 行为 控制 :形成 较 完备 的 体系 
“管理 行为 要 求 ” 共 出 现 20 次 ， 在 行为 控制 策略 中 占 比 28.17%, 说 明 管 理 行为 在 控制 
科学 数据 中 有 所 实践 ， 但 被 运用 得 不 够 充分 。 尽 管 如 此 ， 管 理 行为 已 形成 了 较 完备 的 体系 : 
编号 管理 、 专 人 专任 、 配 备 专门 设备 、 定 期 审查 、 是 否 公 布 、 如 何 公 布 、 是 否 更 新 、 如 何 更 
新 、 如 何 保存 等 管理 措施 ， 贯 通 数据 的 收集 、 传 输 、 存 储 、 处 理 和 交换 各 阶段 ， 而 且 部 分 规 
定 较为 细致 ， 便 于 平台 的 日 常 管理 工作 。 
3. 2 四 类 其 他 策略 涵盖 多 元 内 容 
3.2.1 目的 控制 : 以 是 否 具有 商业 性 为 判断 
目的 控制 以 用 途 是 否 具 有 商业 性 为 标准 , 平台 许可 具有 非 商 业 目 的 用 户 获 取 、 使 用 科学 
数据 ,排除 商业 性 用 途 。 目 的 控制 出 现 7 次, 在 全 部 样本 中 占 比 6.86%， 呈 现 3 种 不 同 模式 : 
@ 出 现 最 多 的 是 “ 反 向 ”规定 ， 即 “不 得 用 于 商业 目的 ”， 不 明示 用 户 需要 具有 何 种 目的 ， 
而 仅 禁 止 商业 目的 ; @“ 正 向 ”规定 出 现 1 次 ， 即 “ 需 以 获得 信息 为 目的 ”， 此 处 宜 适 用 限 
缩 解释 ， 即 用 户 仅 以 “获知 ”为 目的 ;， © “概括 ”规定 出 现 1 次 ， 即 “严禁 任何 未 经 本 协议 
明确 允许 的 目的 使 用 ”， 平 台 未 给 出 明确 允许 的 目的 说 明 或 列表 。 总 体 来 看 ， 反 向 规定 和 正 
向 规定 中 的 目的 都 是 具体 明确 的 , 前 者 给 予 用 户 的 使 用 空间 最 大 , 后 者 给 予 用 户 的 使 用 空间 
最 小 ， 而 概括 规定 是 模糊 的 ， 用 户 使 用 空间 可 大 可 小 ， 不 便于 用 户 判 断 。 
c 3.2.2 权利 控制 产权 归属 与 用 户 权利 限制 
c 权利 控制 包括 两 方面 内 容 : @ 平 台所 提供 科学 数据 的 知识 产权 或 数据 权利 归属 ; @ 用 户 
Q 对 已 获取 的 科学 数据 享有 何 种 权利 。 权 利 控制 出 现 9 次 ， 在 全 部 样本 中 占 比 8.82%， 其 中 知 
识 产权 归属 出 现 5 次 、 数据 权利 归属 出 现 2 次 , 分 属于 不 同 平台 。 从 主体 上 看 , 涉及 平台 方 、 

原单 位 或 原作 者 三 方 主体 ， 各 平台 对 知识 产权 、 数 据 权利 的 归属 尚未 达成 共识 ， 既 有 “ 归 平 
台所 有 ”， 也 有 “ 归 原 单位 所 有 ”， 还 有 “ 归 原 作者 与 平台 共有 ”。 从 依据 上 看 ， 依 据 来 源 
或 是 平台 投入 来 判断 归属 ,是 平台 的 “一 家 之 言 ”， 有待 进一步 明确 权利 归属 的 正当 性 依据 。 
此 外 , 用 户 权利 限制 出 现 2 次 , 意味 着 赋予 用 户 的 权利 很 少 一 一 实际 上 仅 赋予 了 使 用 权 ， 且 
进行 严格 的 限制 ,例如 用 户 对 提供 的 地 震 科 学 数据 、 气 象 资料 只 享有 有 限 的 、 不 排他 的 使 用 
权 。 限 制 条 件 “ 有 限 的 ”“ 不 排他 ”的 积极 意义 在 于 ， 防 止 科 学 数据 被 滥用 或 垄断 。 
3. 2. 3 身份 控制 : 资格 等 级 决定 可 获取 数据 

身份 控制 是 指 在 用 户 获取 科学 数据 时 需要 具有 的 身份 资格 等 级 , 辟 如 注册 用 户 、 实 名 认 
证 用 户 、 协 议 用 户 等 。 身 份 控制 出 现 9 次 ， 在 全 部 样本 中 占 比 8.82%， 内 容 上 均 表意 为 获取 
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身份 限制 ， 即 相应 身份 资格 的 用 户 仅 能 获取 相对 应 等 级 的 科学 数据 。 此 处 所 说 “相应 等 级 ” 
并 非 严格 遵循 某 项 标准 ， 而 是 平台 自行 规定 的 数据 分 级 分 类 制度 ,对 非 本 平台 的 科学 数据 并 
不 适用 。 对 于 用 户 来 说 ， 获 取 相 应 的 身份 资格 需要 完成 二 次 申请 ， 如 “协议 公开 \ 共 享 数 据 
仅 限 协议 用 户 获 取 ” 中 的 “协议 用 户 ”， 需 要 使 用 者 在 成 为 普通 用 户 后 再 次 提交 申请 ， 待 平 
台 进 一 步 审核 通过 后 才能 成 为 协议 用 户 。 本 质 上 , 身份 控制 是 通过 多 次 审核 实现 加 强 平台 控 
制 力 的 目的 。 
3.2.4 责任 控制 : 平台 与 用 户 责任 分 配 失衡 

责任 控制 则 在 确定 出 现 乎 台 或 用 户 不 利 后 果 时 , 应 该 由 哪 一 方 来 承担 责任 。 责任 控制 出 
现 6 次 , 在 全 部 样本 中 占 比 5.88%, 可 以 归纳 为 两 类 : 整体 性 规定 , 诸如 “用 户 自 担 风 险 ”， 
意 指 一 切 风 险 由 用 户 自行 承担 ; 所 具体 性 规定 ， 诸 如 “承担 版 权 侵权 足 任 ”， 是 明确 告知 用 
户 未 经 许可 有 删 减 版 权 信息 的 行为 后 果 。 进一步 分 析 可 知 , 平台 设置 整体 性 规定 可 能 旨 在 减轻 
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r 自身 的 审查 义务 ， 例 如 “用 户 接收 、 依 赖 或 使 用 平台 所 提供 数据 均 自行 承担 风险 ，NGDC 
=< 不 对 相关 信息 的 错误 、 不 准确 或 遗漏 承担 任何 法 律 责任 ”。 考虑 到 科学 数据 是 由 该 领域 内 的 
= 科学 机 构 或 学 者 提供 ， 科 学 数据 平台 作为 媒介 ， 进 行 专 业 性 的 实质 审查 的 能 力 和 成 本 有 限 ， 
= 列 出 此 类 规定 也 在 情理 之 中 。 倘若 能 将 此 类 整体 性 规定 向 具体 性 规定 转化 , 分 不 同情 形 明 确 
= 责任 主体 ， 则 有 助 于 各 主体 采取 积极 行为 防止 不 利 后 果 发 生 。 


N 4 优化 建议 

= 科学 数据 控制 策略 的 “五 控 一 体 ” 模 型 〈 见 图 1) 是 基于 全 样本 ， 通 过 扎根 理论 方法 提 
取 行 为 、 权 利 、 身 份 、 目 的 和 责任 5 个 要 素 而 构建 的 “ 实 然 模型 ”。 该 模型 体现 了 科学 数据 
空 制 策略 的 现实 情况 ， 从 应 然 角 度 审 视 ， 其 还 存在 优化 的 空间 。 以 “事前 一 事 中 一 事后 ”三 
c 阶段 控制 理论 审视 “五 控 一 体 ” 模 型 时 ， 发 现 这 5 个 要 素 可 以 分 置 在 不 同 的 控制 阶段 ， 权 
c 利 控制 、 身 份 控制 与 目的 控制 侧重 于 在 行为 发 生前 约束 主体 ， 归 于 事前 控制 ; @ 行 为 控制 一 
般 针 对 行为 本 身 进行 规定 , 归于 事 中 控制 ;@ 责 任 控制 主要 明确 行为 发 生 后 的 不 利 后 果 承 担 ， 
归于 事后 控制 。 鉴 于 此 ， 优 化 科学 数据 控制 策略 ， 可 以 考虑 从 “五 探 一体” 模型 转向 “三 阶 
段 ” 模型 〈 见 图 2) ， 实 现 事 前 一 事 中 一 事后 三 阶段 控制 。“ 三 阶段 ”模型 仍 以 “五 控 一 体 ” 
模型 为 基础 ， 并 未 改变 其 “目的 ”“ 身 份 ”“ 权 利 ”“ 行 为 ”和 “责任 ”这 5 个 内 部 构成 要 
素 ， 只 不 过 调整 了 除 “ 行 为 ”以 外 要 素 的 位 置 关 系 ， 并 就 调整 位 置 后 的 各 要 素 相 应 提出 内 容 
上 的 优化 。 

将 以 “行为 ”为 中 心 的 “目的 ” “身份 ”“ 权 利 ” 和 “责任 ” 散 点 分 布 ， 调 整 为 “目的 、 
身份 和 权利 归 入 事前 阶段 >”“ 行 为 归 入 事 中 阶段 >”“ 责 任 归 入 事后 阶段 ” 的 三 阶段 分 布 。 各 
阶段 的 数位 命名 《前 、 中 、 后 ) 并 不 代表 三 阶段 是 单 向 的 线性 关系 ， 行 为 控制 的 核心 地 位 并 
未 改变 , 其 他 4 个 策略 仍然 通过 影响 行为 策略 实现 控制 , 例如 事前 的 权利 限制 会 影响 事 中 的 
用 户 使 用 行为 实施 ， 事 后 的 责任 内 容 会 影响 事 中 的 平台 管理 行为 实施 。 因 此 ， 划 分 事前 、 事 
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中 和 事后 3 个 阶段 并 没有 改变 控制 策略 之 间 的 基本 关系 ,而 是 基于 各 策略 的 重点 内 容 , 旨 在 


形成 一 个 更 加 有 序 可 循 且 集 事前 预防 、 事 中 管理 与 事后 归 责 于 一 体 的 科学 数据 控制 策略 体 
系 。 
目的 控制 身份 控制 
f Ju 7 
| 使 用 目的 限制 | 获取 身份 限制 | 
1 高 | remp 
| Ii 5. RS [ Emm ean; 
1 | 目 Him MISES ben | 
i: e 时， 公务 |o EE 3 | 
| rae Wie ccu | 
权利 控制 
aid 数据 权利 归属 | | | 
= 和 学 数据 持 有 权 归 提供 者 。 | | | 
| 科学 数据 加 工 使 用 权 归 用 户 1| 知识 产权 归属 | 用 户 权利 限制 | 
科学 数据 加 工 权 归 平台 | | | 
|_ 科学 数据 产品 经 营 权 归 平台 |) | | 
i 行为 控制 
行业 
事 中 管理 四 GG 
行 管理 行为 要 求 ; | 上 一- pce 
eS ee TEN ORE TUN 
责任 控制 
PERENNE 风险 责任 承担 M 
TRAH ”科学 数据 提供 者 。 科学 数据 服务 者 。 ”科学 数据 使 用 者 
(科研 人 员 或 机 构 等 ) 0000 MA NEL E 


图 2 科学 数据 的 “三 阶段 ”控制 策略 模型 


Figure 2 Model of the “three-stage” control strategy of scientific data 


4.1 事前 预防 ; 细 化 三 项 策略 内 容 
4.1.1 强化 目的 控制 : 概括 列举 目的 类 型 

用 户 获取 或 使 用 科学 数据 的 真实 动机 和 目的 内 隐 性 强 , 强化 目的 控制 的 关键 在 于 不 能 笼 
统 地 规定 “禁止 商用 ”， 而 应 明确 用 户 可 用 或 不 可 用 的 具体 目的 类 型 ， 便 于 用 户 事先 判断 其 
基于 特定 目的 可 和 否 获取 或 使 用 特定 的 科学 数据 。 如 果 采 用 反 辐 规定 ， 仅 简单 规定 “不 得 用 于 
商业 目的 ”， 对 于 普通 用 户 而 言 ， 判 断 是 否 为 商业 用 途 并 非 易 事 。 目 的 是 否 属于 商业 用 途 ， 
不 能 简单 地 以 主体 是 否 具 有 商业 身份 而 “一 言 项 之 ”。 考虑 到 概括 规定 也 需 明确 允许 的 使 用 
目的 ， 建 议 推行 “概括 + 列举 ”模式 列 明 目的 类 型 。“ 概 括 ” 有 利于 提升 解释 空间 ，“ 列 举 ” 
9 利于 类 比 判断 。 使 用 目的 以 是 否 具 有 营利 性 为 判断 标准 , 可 分 为 直接 营利 与 间接 营利 两 种 
类 型 ， 商 业 目 的 包括 但 不 限于 直接 或 间接 从 事 有 偿 分 享 、 营 销 、 交 易 等 活动 ， 可 用 目的 包括 
不 以 营利 为 目的 的 科研 、 试 验 、 教 学 、 公 务 或 公益 等 


11 


ChinaXiv 合 作 期 刊 


4.1.2 加 强权 利 控制 : 明确 数据 权利 归属 

权利 控制 所 涉及 的 是 知识 产权 、 数 据 的 权利 归属 ， 因 知识 产权 已 经 有 法 律 规 定 ， 其 归属 
可 以 依法 确定 ， 而 数据 权利 因 缺 乏 法 律 规定 ， 其 归属 问题 还 处 于 探索 实践 阶段 。 平 台所 发 布 
的 科学 数据 并 非 当 然 归 属于 平台 、 用 户 或 提供 者 ， 可 以 《数据 二 十 条 》 叫 为 政策 依据 ， 根 据 
科学 数据 来 源 和 生成 特征 ,分 别 界定 数据 生产 、 流 通 、 使 用 过 程 中 提供 者 、 平 台 和 用 户 享有 
的 合法 权利 ， 建立 以 持 有 、 加 工 使 用 、 产 品 经 营 等 为 内 容 的 数据 产权 运行 机 制 。 暂 不 考虑 提 
供 者 享有 科学 数据 持 有 权 的 正当 性 ,提供 者 不 因 科学 数据 上 传 平台 而 丧失 持 有 权 ; 赋予 平台 
基于 汇总 的 科学 数据 加 工 权 , 并 对 加 工 形成 的 科学 数据 集 等 产品 享有 经 营 权 ; 允许 用 户 基于 
约定 目的 , 对 从 平台 获取 的 数据 享有 加 工 使 用 权 。 如 此 形成 科学 数据 的 结构 性 分 置 产权 制度 ， 
利于 激发 不 同 主体 的 积极 性 。 


4.1.3 补 强身 份 控制 : 统一 分 级 分 类 管理 


pei 将 用 户 身份 进行 分 类 具有 一 定价 值 ， 如 用 户 分 类 模型 〈TIS 模型 ) 框架 为 在 线 用 户 创 新 
e 社区 〈OUICs) 的 用 户 管理 提供 了 理论 指导 ， 提 高 了 社区 用 户 的 有 效 管理 和 利用 ， 使 其 创新 
© 价值 最 大 化 加。 身份 控制 背后 体现 的 是 平台 分 级 分 类 管理 科学 数据 的 理念 ， 设 置 不 同 用 户 
5 访问 权限 对 应 不 同等 级 的 科学 数据 ， 有 限度 、 有 层次 地 实现 科学 数据 公开 或 共享 。 尚 未 实施 
身份 控制 策略 的 平台 ,意味 着 其 内 部 的 科学 数据 分 级 分 类 与 用 户 分 级 匹配 还 不 完善 。 科 学 数 
据 的 内 容 涉及 面 广 、 专 业 程 度 高 、 蓓 载 利益 多 元 ， 且 通常 是 跨 学 科 、 跨 部 门 或 跨行 业 的 ， 这 


导致 不 同 平台 对 于 所 控制 科学 数据 的 敏感 性 与 风险 性 认 知 不 一 。 因 此， 身份 控制 的 完善 路 径 
应 自 下 而 上 ,由 各 平台 先 实施 契合 自身 实际 的 科学 数据 分 级 分 类 方法 , 并 延续 已 有 的 获取 身 
份 要 求 ， 区 分 注册 用 户 、 实 名 用 户 、 协 议 用 户 等 不 同 身份 给 予 不 同 权 限 。 补 强身 份 控制 的 关 
键 在 于 分 级 分 类 管理 ， 有 助 于 落实 《数据 二 十 条 》 中 “把 该 管 的 管 住 、 该 放 的 放 开 ”的 要 求 
= m， 进 而 形成 统一 的 行业 规范 。 
O 4.2 事 中 管理 ， 优 化 行为 策略 结构 
4. 2. 1 转型 平台 自治 : 平衡 平台 管理 与 用 户 控制 

用 户 使 用 行为 要 求 、 用 户 获 取 行 为 要 求 和 平台 管理 行为 要 求 ,虽然 主体 有 差别 , 但 是 其 
性 点 在 于 都 是 由 国家 级 科学 数据 平台 自行 设 定 , 可 统称 为 平台 自治 。 获 取 行为 要 求 和 使 用 
行为 要 求 的 受 控 主体 都 是 用 户 ， 二 者 共同 构成 了 用 户 行 为 控制 策略 。 当 前 ,平台 自治 重心 在 
于 限制 用 户 的 获取 、 使 用 行为 ， 而 数据 价值 在 于 利用 ， 国 家 也 在 积极 推动 数据 开放 共享 ， 用 
户 行为 限制 愈 多 , 科学 数据 开放 共享 程度 就 难以 相对 提高 。 平 台 自 治 要 坚持 “把 该 管 的 管 住 、 
该 放 的 放 开 ”， 在 保障 安全 的 前 提 下 尽 可 能 地 “ 少 约 束 、 多 开放 ”。 一 方面 ， 平 台 承 担 着 维 
护 平 台 安 全 、 保 障 科 学 数据 安全 等 责任 , 这 意味 着 平台 自治 仍然 需 控 制 用 户 行为 ; 另 一 方面 ， 
科学 数据 中 心 是 促进 科学 数据 开放 共享 的 重要 载体 ， 这 意味 着 用 户 应 该 被 更 少 地 约束 。 故 ， 
平台 自治 应 从 “重用 户 行为 控制 ， 轻 平台 管理 行为 ”转向 “平台 管理 与 用 户 控制 相 平 衡 ”。 
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4.2.2 新 增 行业 他 律 : 促进 平台 意识 与 规范 统一 

从 整体 上 来 看 ， 本 次 调查 取样 过 程 中 ， 仅 有 14 个 国家 级 科学 数据 平台 在 官网 中 提供 了 
用 户 协 议 ， 其 他 平台 官网 要 么 无 法 进入 、 要 么 无 法 在 页 面 中 找到 相关 文件 。 从 个 体 上 来 看 ， 
平台 行为 控制 策略 呈现 出 “个 体 化 ”多 于 “统一 化 ”的 趋势 。 例 如 ， 有 的 平台 规定 了 获取 行 
为 要 求 ， 有 的 平台 对 此 则 没有 规定 ， 又 如 ， 有 的 平台 规定 集中 于 某 一 项 或 某 两 项 控制 策略 ， 
有 的 平台 规定 包含 了 多 项 控制 策略 。 即 便 各 平台 都 偏重 于 行为 控制 , 但 却 并 未 形成 实施 行为 
控制 的 共识 ， 更 没有 发 展 出 统一 的 行为 控制 规范 。 因 此 ， 可 以 考虑 由 科技 部 直属 事业 单位 一 
一 国家 科技 基础 条 件 平 台中 心 窑 头 ,在 其 “建设 规范 标准 和 管理 方式 ”职责 范围 内 ,推动 促 
进 各 平台 形成 统一 行为 管理 共识 ， 制 定 通用 的 行为 管理 规范 。 相 对 于 前 述 平台 自治 来 说 ， 这 
种 行业 他 律 能 确保 各 平台 行为 策略 的 最 低 要 求 。 此 外 ,允许 各 平台 在 通用 行为 管理 规范 的 基 
础 上 增加 “个 体 化 ”元 素 。 
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m 4.3 事后 归 责 改进 责任 策略 分 配 

2 合理 分 配 责任 意味 着 主体 均 承 担 与 其 行为 相应 的 责任 ,不 排除 己方 责任 ,不 将 己方 责任 
© 转移 至 他 方 。 科 学 数据 服务 者 《〈 平 台 ) TEAR SRE EHA RRE E 
= 用 者 (用 户 ) 之 间 的 桥梁 ， 串联 起 了 科学 数据 从 产生 、 汇 交 到 使 用 的 整个 过 程 。 如 前 所 述 提 
一 供 者 、 平 台 和 用 户 应 享有 相应 的 数据 权利 ， 他 们 也 应 当 承 担 相 应 的 责任 。 责 任 分 配 是 确保 责 


任 控制 策略 发 挥 作用 的 重要 机 制 ， 应 在 提供 者 、 平 台 和 用 户 三 方 主体 间 合 理 分 配 责 任 。 科 学 
数据 质量 高 低 与 提供 者 密切 相关 ， 故 提供 者 应 承担 确保 数据 的 真实 性 、 有 效 性 、 格 式 规范 性 
等 责任 ; 平台 应 以 确保 提供 的 科学 数据 可 发 现 、 可 访问 、 可 互 操作 、 可 重用 为 己任 四， 夏 
基本 责任 应 包括 数据 的 审查 责任 、 管 理 责任 和 安全 保障 责任 等 ; 用 户 则 需要 依法 依 规 获取 和 
使 用 科学 数据 ， 并 严格 遵守 平台 的 相关 规定 ， 违 反 不 得 转让 给 第 三 方 、 使 用 需 标明 出 处 、 不 
得 随意 修改 数据 等 应 承担 责任 。 


5 结语 

科学 数据 既 不 像 个 人 数据 那样 涉及 复杂 的 人 格 利益 , 又 不 像 企 业 数 据 那样 荷载 丰富 的 财 
产 利 益 ， 可 能 是 科学 数据 的 公益 性 使 然 ， 其 关注 度 远 不 如 个 人 数据 或 企业 数据 。 然 而 ， 科 学 
数据 是 一 国 科学 发 展 的 重要 战略 资源 , 科学 数据 平台 承担 着 整合 科学 数据 、 提供 科学 数据 服 
本命， 是 科学 数据 开放 共享 的 重要 载体 0D1。 我 国 已 经 出 台 了 《科学 数据 管理 办 法 》 
《国家 科技 资源 共享 服务 平台 管理 办 法 》 等 政策 文件 ， 以 及 《科技 计划 形成 的 科学 数据 汇 交 
技术 与 管理 规范 》 等 国家 标准 ,在 科学 数据 治理 领域 已 形成 了 基本 制度 。 科学 数据 控制 策略 
的 建立 和 完善 是 科学 数据 平台 制度 建设 的 核心 , 也 是 数据 基础 制度 建设 的 关键 内 容 。 虽然 学 
界 关 于 科学 数据 的 研究 成 果 相当 丰富 ， 但 对 科学 数据 控制 策略 的 研究 稍 显 不 足 。 

鉴于 此 , 本 文 运用 扎根 理论 方法 , 以 国家 级 科学 数据 平台 运行 实践 中 的 用 户 协议 为 样本 ， 
研究 科学 数据 控制 策略 问题 。 可 能 的 创新 之 处 和 后 续 研 究 空间 归纳 如 下 : 拓展 了 科学 数据 
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研究 主题 的 宽度 , 后 续 研 究 可 推进 科学 数据 控制 策略 的 理论 构建 ; @ 提 炼 出 科学 数据 控制 策 
略 的 目的 、 行 为、 权利 、 身 份 和 责任 5 个 构成 要 素 ， 后 续 研 究 可 在 此 基础 上 细 化 要 素 内 容 或 
提出 新 的 要 素 ;@@ 总 结 “ 五 控 一 体 ”控制 策略 模型 ， 并 在 此 基础 上 优化 提出 “三 阶段 ” 控 睹 
策略 模型 ， 后续 研 究 修 正 或 优化 前 述 策略 模型 。 不 过 本 文 仍 有 不 足 之 处 , 研究 样本 仅 为 国家 
级 科学 数据 中 心 与 数据 库 , 并 未 将 上 海 研发 公共 服务 平台 、 黑龙江 省 科技 资源 共享 服务 中 心 
等 地 方 平台 纳入 调查 范畴 。 
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Abstract : [Purpose/Significance] Proposing and optimizing the control strategy and model of 
scientific data will help to promote the basic system of scientific data platform and balance the 
protection and sharing of scientific data. [Method/Process| Taking the user agreements of the 


national scientific data center as samples, it obtained 76 initial concepts, 9 subcategories and 5 
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main categories, and then refined the control strategy model of scientific data. [Result/Conclusion] 
In China, scientific data platform has formed a "five-control-in-one" control strategy model with 
purpose, behavior, rights, identity and responsibility as the constituent elements, which can be 
optimized a "three-stage" control strategy model in the aspects of pre-defense, in-process 
supervision and post-event rules. Specifically, the measures include: summarizing the purposes 
types for purpose control; clarifying the ownership of data rights for rights control; unifying 
classification management for identity control; transforming platform autonomy by the balance of 
platform management and user control, and adding new industry heteronomy for the unity of 
platform awareness and norms; rationally allocating the responsibilities of platforms, users and 
scientific data providers. 
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